Get a PDF

О ТРУДНЫХ ЗАДАЧАХ и AI

 

Бытует мнение, что поскольку AI вскоре станет значительно умнее человека, то и работы он нас скоро лишит почти всех. Потому как наш мозг умеет развивать только 20 ватт вычислительной мощности, а AI-датацентры ничем в этом не ограничены.

Мнение это проистекает из допущения о том, что качество решения практически важной интеллектуальной задачи пропорционально главным образом объёму вложенных в неё вычислений. Но это не так, даже при одинаковых алгоритмах.

В жизни полно задач интеллектуальных, высокооплачиваемых, и не сводящихся к пусканию пыли в глаза, где даже на порядки более слабый "CPU" может успешно соревноваться с резко превосходящими его монстрами.

Заметим, что человек + AI в любом случае разовьёт лучшую производительность, чем человек или AI по отдельности, но это пока тема совсем другой истории. А пока просто пройдёмся по примерам задач.

 

1. Logistic Map https://en.wikipedia.org/wiki/Logistic_map

Простейшая, одномерная последовательность значений xn, сменяющихся по закону xn+1 = r*xn*(1-xn).

Почему не решается? Потому что при r > 3.57 в этой задаче возникает динамический хаос. Два решения, сколь угодно близкие на старте, расходятся друг от друга со временем экспоненциально, и любое предсказание очень быстро теряет силу. Это поведение таково само по себе в физическом мире, и не имеет отношения к вычислительным эффектам.

Какие жизненные процессы описываются этим уравнением?

* (Дискретная) динамика хищник-жертва.

* Следовательно, при ряде условий, динамика конкурирующих бизнесов, политических схваток, ну и, конечно, экосистем.

* Динамика некоторых supply chains.

Задача в одну переменную. Решать можно хоть на калькуляторе. Но получить решение лучше, чем выданное всем интеллектом мира во всех датацентрах.

Потому что качество его определяется не вычислительной мощностью, не объёмом памяти, не хорошими алгоритмами и даже не объёмом доступных для анализа данных. А точностью данных на старте. (ОК, ОК, в пределе низких шумов длительность прошлых наблюдений может помочь с качеством предсказания. Где-то логарифмически.)

По какой причине наблюдатель/участник процесса, сидящий к нему "ближе", легко рвёт экспертов и самые умные модели. Что вызвает регулярный батхёрт у умников: как так, полуобразованное и ничего не читавшее чмо предсказывает бизнес-процессы (и имеет с этого выгоду!) лучше, чем мы, такие все учившиеся в университете N лет и имеющие целостную и правильную картину мира.

 

2. Система Лоренца, Росслера, и ей родственные.

Система из трёх дифференциальных уравнения на три параметра. Не сильно по виду даже сложная.

Почему не решается? Да по той же причине. Динамический хаос. Ни одна LLM-ка не может его предсказать радикально дальше, чем дифурчик, сосчитанный на 286-й. Качество решения зависит, тоже, главным образом от наличия *точных* данных, нежели их объёма или величины CPU. Хоть обсчитайся.

Что им описывается?

* Конвекция.

* Соответственно, погода.

* Жидкостное и воздушное охлаждение сложных инженерных систем.

* (При ряде допущений) нелинейная динамика эмоционального взаимодействия двух человек.

 

3. "...и другие официальные лица...", то есть множество задач с динамическим хаосом, как то:

* Биллиард обыкновенный

* Jerk equation, возникающий во многих электрических цепях

 

4. Halting Problem

Формулировка: дан кусок кода. Определите, не исполняя его, будет ли он исполняться вечно, или завершится.

Доказано, что не существует алгоритма для решения этой задачи.

Где возникает? Да в security. Где по кусочку неизвестного кода надо, не запуская его, понять, завершится ли он, или останется резидентом в системе.

Поскольку задача не решается точно, приходится применять эвристики. Которые все плохи, ибо, см. выше, хорошего решения нет. Соответственно, конкурентоспособными иногда оказываются эвристики даже от самых слабых интеллектов.

(Примером чего, собственно, и стал нынешний жутчайший тупик security industry после фактически подмены security на identity, случившейся в районе 2012-го. Все системы с тех пор дырявы насквозь; ломают их в половине случаев всё теми же методами, которыми ломали 20 лет назад, до запуска проверок identity; а 95% современной security force превратилось в бюрократов, расставляющих запреты и разрешения и не вычисляющих вообще ничего. Но никто их эти 12 лет не гнал и зарабатывали они о-го-го. Что плохо для индустрии и для всех нас, но таки хорошо, если мыслить с позиции риска потери профессии и работы)

 

5. Составление расписания.

Дано N элементов, которые надо посетить/сделать/окучить. Посещение любого из них приводит к нетривиальной смене приоритета/важности всех остальных. В каком порядке будем окучивать?

Точное решение, как легко видно, достижимо только полным перебором и потому имеет сложность O(N!). Что уже при N = 20 превосходит вычислительные возможности любого интеллекта.

Где встречается? Вот тебе надо провести переговоры с десятком бизнес-партнёров. Которые все, естественно, между собой сплетничают, и отдают приказы, меняющие расклад на поле, прямо по результатам общения с тобой,  пока ты разговариваешь со следующим человеком. И в каком порядке прикажете вести с ними переговоры?

Разумеется, никто эту задачу точно не решает. Все пользуются теми или иными упрощающими эвристиками ("...задачи в первом приближении независимы друг от друга..."). По каковой причине побеждает тот, кто выбрал более правильную эвристику. Однако в пределе выхода этих эвристик на близкую к абсолютной производительность, объём "перевариваемых" элементов N зависит от вычислительной мощности P приблизительно как N = Ln(P)/Ln(Ln(P)). Что на "20-ваттном" и на "мегаваттном" интеллекте даст разницу меньше, чем в два раза. Наше сознание остаётся вполне конкурентоспособным на этой задаче.

Да, можно возразить, что точное расписание не так уж и важно. Что его приблизительно составят за тебя, и вперёд. Что ж, может быть, и составят. Кого-то это даже и устроит. Но я не думаю, что это решение удастся продать людям, от качества расписания которых зависит, быть или не быть бизнесу, а то и войне. Человек -- это продукт его расписания. Либо у человека оно есть, тщательно защищаемое от вбросов, ухоженное, и регулярно анализируемое. Либо же он проживает чью-то чужую задачу, вот и всё.

У этой задачи есть близкая формулировка с экспоненциальной сложностью: дано N работ, которые надо закончить, и в которых есть перерывы. Начало, конец и перерывы каждой фиксированы. Как выбрать из них набор, максимализирующий загруженность? Задача возникает перед каждым голливудским актёром, желающим сняться в как можно большем количестве фильмов без простоев.

 

6. Уравнение теплопроводности задом наперёд.

Дано распределение тепла по телу. Каким оно было N минут назад?

"В лоб" не решается, при том что у ответа можно даже записать формулу. Но формула эта при обращении бывает бесконечно неустойчива к ничтожным вариациям начальных условий. В зависимости от того, как ты их додумаешь, ты получишь очень разные ответы. Правильность додумывания определяется не столько интеллектом или вычислительной мощностью, сколько наличием специфических знаний об области и о задаче в частности.

Где встречается? Далеко не только в физике. Вот у нас в соцсетях слух вдруг странный распространяется. Откуда раздувается? Это оно.

 

7. Задачи с убывающим откликом на затрату вычислений.

Есть проблемы, где качество решения зависит от затраченных вычислительных ресурсов линейно. Есть -- где логарифмически. Есть, где ещё хуже и медленнее. А есть, где чем дольше считаешь, тем хуже получается.

Классический пример старше ста лет уже -- асимптотические ряды из математики. Первые члены улучшают решение. Потом не очень. Потом никак. А потом.... начинают ухудшать его.

Вы скажете, нефиг считать дальше порога. Так ведь порог-то в жизненной проблеме далеко не всегда очевиден. Сплошь и рядом ухудшение решения становится заметным лишь после эдак недели усилий. Покуда более "слабый" мозг давно пожинает выгоды с "более слабого" решения.

===

Что между всеми этими задачами общего? Они все "плохо поставлены". Их решения "в лоб" безумно дороги, крайне неустойчивы, бессмысленны, либо вообще не существуют. А становятся "хорошими" только после (иногда очень незначительного) додумывания, которое может даже включать намеренное прерывание/загрубление решения. Собственно, я берусь утверждать, что все жизненно важные задачи, за которые платят реальные деньги, относятся к этому классу.

===

Заметим, что AI, несмотря на всю его мощность -- это, в конечном итоге, всё тот же supervised learning на стероидах. Без размеченных примеров он работать не будет. Но откуда эти примеры возьмутся? Вот. Кто выбирает, на чем тренировать AI, тот управляет AI. А кто контролирует, какие метки считать "правильными", а какие нет, управляет миром.

И это ещё две огромаднейшие сферы занятости.

===

Разумеется, проблема с риском потери работы из-за AI есть. Но она состоит не в том, что он лишит нас старых работ. А в людях, AI управляющих. Мы говорим и пишем про AI так, как будто это самостоятельный агент, но ведь на 95% это -- инструмент в руках очень узкого круга людей. Эти люди могут ошибаться. Они, не AI, могут решить, что программистов выгодно разогнать прямо сейчас, даже если завтра же всё развалится. Они могут затеять войну, афёру, неслыханную цензуру, катастрофическую реформу. Им может показаться, что умники слишком уж мешают единству. Эти возможности перечислены не потому даже, что я лично кому-то не особо доверяю, а потому, что случайные флуктуации в ансамбле из N принимателей решений растут, грубо говоря, как 1/√N. Независимо от моего доверия. И N выглядит опасно малым.

Понятно, что AI не только закроет старые профессии, но создаст и новые. Пока нам непонятные. Понятно, что некоторые конторы предпочтут просто сократить расходы, разогнав 80% людей. Но ещё понятно, что не все. Хотя бы случайно кто-нибудь должен стремиться в развитие, а не в экономию. Набредя, пусть бы и тоже случайно, на пусть бы и несовершенные методы вытачивания принципиально новой экономической выгоды с помощью AI, они резко оставят всех за бортом. К ним, в итоге, и надо идти работать. Это "перетекание" -- лишь вопрос времени. К сожалению, возможно, времени небыстрого и не слишком лёгкого.

 

01.2025

===

Text Author(s): Eugene Bobukh     ===     Web is volatile. Files are permanent. Get a copy: [PDF] [Zipped HTML]     ===     Full list of texts: http://tung-sten.no-ip.com/Shelf/All.htm]     ===     All texts as a Zip archive: http://tung-sten.no-ip.com/Shelf/All.zip] [mirror: https://1drv.ms/u/s!AhyC4Qz62r5BhO9Xopn1yxWMsxtaOQ?e=b1KSiI]     ===     Contact the author: h o t m a i l (switch name and domain) e u g e n e b o (dot) c o m     ===     Support the author: 1. PayPal to the address above; 2. BTC: 1DAptzi8J5qCaM45DueYXmAuiyGPG3pLbT; 3. ETH: 0xbDf6F8969674D05cb46ec75397a4F3B8581d8491; 4. LTC: LKtdnrau7Eb8wbRERasvJst6qGvTDPbHcN; 5. XRP: ranvPv13zqmUsQPgazwKkWCEaYecjYxN7z     ===     Visit other outlets: Telegram channel http://t.me/eugeneboList, my site www.bobukh.com, Habr https://habr.com/ru/users/eugeneb0/posts/, Medium https://eugenebo.medium.com/, Wordpress http://eugenebo.wordpress.com/, LinkedIn https://www.linkedin.com/in/eugenebo, ЖЖ https://eugenebo.livejournal.com, Facebook https://www.facebook.com/EugeneBo, SteemIt https://steemit.com/@eugenebo, MSDN Blog https://docs.microsoft.com/en-us/archive/blogs/eugene_bobukh/     ===     License: Creative Commons BY-NC (no commercial use, retain this footer and attribute the author; otherwise, use as you want);     ===     RSA Public Key Token: 33eda1770f509534.     ===     Contact info relevant as of 7/15/2022.

===